Extraction de motifs séquentiels. Problèmes et méthodes

نویسندگان

  • Florent Masseglia
  • Maguelonne Teisseire
  • Pascal Poncelet
چکیده

SYNOPSIS. Dans un premier temps, le problème de l’extraction de motifs séquentiels peut sembler proche de celui de l’extraction de règles d’association. Ce rapprochement s’avère cependant très fragile en raison d’un élément clé qui est propre à l’extraction de motifs séquentiels : la temporalité. Cette notion permet à la fois de distinguer à l’intérieur des enregistrements un ordre d’apparition mais aussi de regrouper certains éléments. En effet si les règles d’association s’appliquent à des données de type itemsets (et permettent l’extraction de règles intra-transaction), la recherche de motifs séquentiels s’applique à des données de type séquences d’itemsets (et permet donc l’extraction de règles inter-transactions). Nous proposons dans cet article de faire un pas en avant dans la compréhension du comportement des principaux algorithmes d’extraction de motifs séquentiels en expliquant et illustrant leur fonctionnement. De plus nous proposons de considérer les problématiques qui ont émergé depuis les motifs séquentiels comme l’extraction incrémentale et interactive, l’extraction sous contraintes, les motifs séquentiels fermés, les motifs séquentiels approximatifs et d’autres problématiques très proches.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Analyse de séquences d'événements avec TraMineR

Les méthodes de fouille de motifs séquentiels fréquents ont donné lieu, depuis le travail fondateur de Agrawal et Srikant (1995), à un grand nombre de travaux de recherche. La librairie TraMineR pour l’environnement statistique R cherche à rendre ces méthodes accessibles aux chercheurs de divers domaines désirant analyser ou visualiser des ensembles de séquences d’événements. Il est à noter que...

متن کامل

Salines : un automate au service de l'extraction de motifs séquentiels multidimensionnels

Résumé. Les entrepôts de données occupent aujourd’hui une place centrale dans le processus décisionnel. Outre leur consultation, une des finalités des entrepôts est de servir de socle aux techniques de fouilles de données. Malheureusement, les approches existantes exploitent peu les particularités des entrepôts (multidimensionnalité, hiérarchies et données historiques). Parmi ces méthodes, l’ex...

متن کامل

Motifs séquentiels multidimensionnels étoilés

L’extraction de motifs séquentiels est un domaine de la fouille de données permettant de rechercher des corrélations fréquentes entre des valeurs en prenant en compte leur chronologie d’apparition. Dans le contexte du panier de la ménagère, ce type de méthodes permet par exemple l’extraction de règles de la forme 〈(TV,DV D)(magneto numerique)〉, indiquant qu’un nombre suffisamment important (au ...

متن کامل

Vers une approche efficace d'extraction de motifs spatio-séquentiels

Résumé. Ces dernières années, l’augmentation de la quantité d’informations spatio-temporelles stockées dans les bases de données a fait naître de nouveaux besoins, notamment en matière de gestion des risques naturels, sanitaires ou anthropiques (p. ex. compréhension de la dynamique d’une épidémie de Dengue). Dans cet article, nous définissons un cadre théorique pour l’extraction de motifs spati...

متن کامل

Fouille de Données Multidimensionnelles : Différentes Stratégies pour Prendre en Compte la Mesure

Résumé. Les entrepôts de données contiennent de gros volumes de données historisées stockées à des fins d’analyse. Des techniques d’extraction de motifs séquentiels multidimensionnels ont été développées afin de mettre en exergue des corrélations entre des positions sur des dimensions au cours du temps. Même si ces méthodes offrent une meilleure appréhension des données sources en prenant en co...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Ingénierie des Systèmes d'Information

دوره 9  شماره 

صفحات  -

تاریخ انتشار 2004